检索结果

Select

1. 基于深度视觉注意神经网络的端到端自动驾驶模型

胡学敏, 童秀迟, 郭琳, 张若晗, 孔力

计算机应用 2020, 40 (7): 1926-1931. DOI: 10.11772/j.issn.1001-9081.2019112054

摘要（391）

PDF （1287KB）（747）

针对现有端到端自动驾驶方法中存在的驾驶指令预测不准确、模型结构体量大和信息冗余多等问题，提出一种新的基于深度视觉注意神经网络的端到端自动驾驶模型。为了更有效地提取自动驾驶场景的特征，在端到端自动驾驶模型中引入视觉注意力机制，将卷积神经网络、视觉注意层和长短期记忆网络进行融合，提出一种深度视觉注意神经网络。该网络模型能够有效提取驾驶场景图像的空间特征和时间特征，并关注重要信息且减少信息冗余，实现用前向摄像机输入的序列图像来预测驾驶指令的端到端自动驾驶。利用模拟驾驶环境的数据进行训练和测试，该模型在乡村路、高速路、隧道和山路四个场景中对方向盘转向角预测的均方根误差分别为0.009 14、0.009 48、0.002 89和0.010 78，均低于对比用的英伟达公司提出的方法和基于深度级联神经网络的方法；并且与未使用视觉注意力机制的网络相比，该模型具有更少的网络层数。

参考文献 | 相关文章 | 多维度评价

Select

2. 基于深度时空Q网络的定向导航自动驾驶运动规划

胡学敏, 成煜, 陈国文, 张若晗, 童秀迟

计算机应用 2020, 40 (7): 1919-1925. DOI: 10.11772/j.issn.1001-9081.2019101798

摘要（428）

PDF （2633KB）（576）

针对目前基于机器学习的自动驾驶运动规划需要大量样本、没有关联时间信息，以及没有利用全局导航信息等问题，提出一种基于深度时空Q网络的定向导航自动驾驶运动规划算法。首先，为提取自动驾驶的空间图像特征与前后帧的时间信息，基于原始深度Q网络，结合长短期记忆网络，提出一种新的深度时空Q网络；然后，为充分利用自动驾驶的全局导航信息，在提取环境信息的图像中加入指向信号来实现定向导航的目的；最后，基于提出的深度时空Q网络，设计面向自动驾驶运动规划模型的学习策略，实现端到端的运动规划，从输入的序列图像中预测车辆方向盘转角和油门刹车数据。在Carla驾驶模拟器中进行训练和测试的实验结果表明，在四条测试道路中该算法平均偏差均小于0.7 m，且稳定性能优于四种对比算法。该算法具有较好的学习性、稳定性和实时性，能够实现在全局导航路线下的自动驾驶运动规划。

参考文献 | 相关文章 | 多维度评价

Select

3. 基于生成对抗双网络的虚拟到真实驾驶场景的视频翻译模型

刘士豪, 胡学敏, 姜博厚, 张若晗, 孔力

计算机应用 2020, 40 (6): 1621-1626. DOI: 10.11772/j.issn.1001-9081.2019101802

摘要（416）

PDF （1339KB）（591）

针对虚拟到真实驾驶场景翻译中成对的数据样本缺乏以及前后帧不一致等问题，提出一种基于生成对抗网络的视频翻译模型。为解决数据样本缺乏问题，模型采取“双网络”架构，将语义分割场景作为中间过渡分别构建前、后端网络。在前端网络中，采用卷积和反卷积框架，并利用光流网络提取前后帧的动态信息，实现从虚拟场景到语义分割场景的连续的视频翻译；在后端网络中，采用条件生成对抗网络框架，设计生成器、图像判别器和视频判别器，并结合光流网络，实现从语义分割场景到真实场景的连续的视频翻译。实验利用从自动驾驶模拟器采集的数据与公开数据集进行训练和测试，在多种驾驶场景中能够实现虚拟到真实场景的翻译，翻译效果明显好于对比算法。结果表明，所提模型能够有效解决前后帧不连续和动态目标模糊的问题，使翻译的视频更为流畅，并且能适应多种复杂的驾驶场景。

参考文献 | 相关文章 | 多维度评价

Select

4. 基于深度级联神经网络的自动驾驶运动规划模型

白丽贇, 胡学敏, 宋昇, 童秀迟, 张若晗

计算机应用 2019, 39 (10): 2870-2875. DOI: 10.11772/j.issn.1001-9081.2019040629

摘要（494）

PDF （992KB）（321）

针对基于规则的运动规划算法需要预先定义规则和基于深度学习的方法没有利用时间特征的问题，提出一种基于深度级联神经网络的运动规划模型。该模型将卷积神经网络（CNN）和长短期记忆网络（LSTM）这两种经典的深度学习模型进行融合并构成一种新的级联神经网络，分别提取输入图像的空间和时间特征，并用以拟合输入序列图像与输出运动参数之间的非线性关系，从而完成从输入序列图像到运动参数的端到端的规划。实验利用模拟驾驶环境的数据进行训练和测试，结果显示所提模型在乡村路、高速路、隧道和山路四种道路中均方根误差（RMSE）不超过0.017，且预测结果的稳定度优于未使用级联网络的算法一个数量级。结果表明，所提模型能有效地学习人类的驾驶行为，并且能够克服累积误差的影响，适应多种不同场景下的路况，具有较好的鲁棒性。

参考文献 | 相关文章 | 多维度评价